Метод многомодального машинного сурдоперевода для естественного человеко-машинного взаимодействия
Аннотация:
Предмет исследования. Исследована возможность повышения надежности автоматической системы распознавания как отдельных жестов, так и жестового языка, за счет использования наиболее информативных пространственно-временных визуальных признаков. Метод. Представленный метод автоматического распознавания жестовой информации основан на интегральной нейросетевой модели, которая анализирует пространственно-временные визуальные признаки: 2D и 3D расстояния от лица до руки; площадь пересечения лица и руки; конфигурацию руки; гендерную и возрастную информацию о дикторе. Для извлечения информации о конфигурации руки разработана нейросетевая модель на основе архитектуры 3DResNet-18 для получения гендерной и возрастной информации. В метод встроены нейросетевые модели из программной платформы Deepface. Основные результаты. Предложенный метод апробирован на данных многомодального корпуса элементов жестового языка TheRuSLan, результаты которого достигают точности распознавания жестов 91,14 %. Практическая значимость. Результаты исследования позволяют повысить точность и робастность не только машинного сурдоперевода, но и естественность человеко-машинного взаимодействия в целом. Полученные результаты могут найти применение в сферах социального обслуживания медицины и образования, в робототехнике и в центрах обслуживания населения.
Ключевые слова:
Постоянный URL
Статьи в номере
- Методы аудиовизуального распознавания людей в масках
- Влияние соотношения интенсивностей опорной и объектной волн на распределение интенсивности в формируемом с их помощью голографическом поле
- Высокоточный волоконно-оптический датчик температуры на основе интерферометра Фабри–Перо с отражающими тонкопленочными многослойными структурами
- Метод проектирования оптической системы для концентрации излучения мощных светодиодов
- Обнаружения выбоин на дорожных покрытиях с использованием методов фотограмметрии и дистанционного зондирования
- Адаптивное управление нелинейным объектом с несогласованными параметрическими неопределенностями и ограничением на входное воздействие
- Применение методов детектирования отказов для обнаружения информационных атак на систему управления
- Алгоритм детектирования и локализации отказов двигателя постоянного тока
- Синтез и реализация λ -подхода скользящего управления в системе теплопотребления
- Фотокаталитические свойства наноструктур Ag–AgBr в ионообменном слое натриево-цинк-алюмосиликатного стекла с бромом
- Формализация языков частично упорядоченных мультимножеств в системе Coq для спецификации слабых моделей памяти
- Облачная интеллектуальная система мониторинга для обнаружения нарушений маски и выдачи предупреждений
- Эффективная инкрементная хеш-цепочка с вероятностным методом на основе фильтра для обновления легких узлов блокчейна
- Метод генерации масок на изображениях лиц и системы их распознавания
- Повышение эффективности обработки жестового языка посредством малокадрового машинного обучения
- Комплекснозначное разложение матричных данных на принципах квантовой теории
- Моделирование базового переводчика индонезийского языка жестов на одноплатном компьютере Raspberry Pi
- Веб-приложение для быстрой оценки субъективных ответов с использованием обработки естественного языка
- Обоснование путей построения и оценка эффективности применения пространственно распределенной системы информационных сенсоров для мониторинга обстановки
- Мониторинг инфильтрационных процессов в гидротехнических сооружениях с использованием распределенного акустического сенсора
- Конструкция волноводной антенны с прорезями для морской радиолокационной системы